Anthropic์˜ Contextual Retrieval ์š”์•ฝ

AI ๋ชจ๋ธ์ด ํŠน์ • ๋งฅ๋ฝ์—์„œ ์œ ์šฉํ•˜๋ ค๋ฉด ๋ฐฐ๊ฒฝ ์ง€์‹์— ๋Œ€ํ•œ ์ ‘๊ทผ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๊ฐœ๋ฐœ์ž๋“ค์€ ์ฃผ๋กœ RAG(Retrieval-Augmented Generation)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ง€์‹ ๊ธฐ๋ฐ˜์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ  ์‚ฌ์šฉ์ž ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ „ํ†ต์ ์ธ RAG ๋ฐฉ์‹์€ ์ •๋ณด๋ฅผ ์ธ์ฝ”๋”ฉํ•  ๋•Œ ๋ฌธ๋งฅ์„ ์ œ๊ฑฐํ•˜์—ฌ ๊ด€๋ จ ์ •๋ณด๋ฅผ ์ œ๋Œ€๋กœ ๊ฒ€์ƒ‰ํ•˜์ง€ ๋ชปํ•˜๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

Contextual Retrieval์ด๋ž€?

Contextual Retrieval์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ, ๋‘ ๊ฐ€์ง€ ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค:

  1. Contextual Embeddings: ๊ฐ ํ…์ŠคํŠธ ์กฐ๊ฐ(chunk)์— ๋ฌธ๋งฅ ์ •๋ณด๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ์ž„๋ฒ ๋”ฉํ•ฉ๋‹ˆ๋‹ค.
  2. Contextual BM25: BM25 ๊ฒ€์ƒ‰ ๊ธฐ๋ฒ•์— ๋ฌธ๋งฅ ์ •๋ณด๋ฅผ ๋ฐ˜์˜ํ•ฉ๋‹ˆ๋‹ค.

์ด๋ฅผ ํ†ตํ•ด ๊ฒ€์ƒ‰ ์‹คํŒจ์œจ์„ 49%๊นŒ์ง€ ๊ฐ์†Œ์‹œํ‚ฌ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ฆฌ๋žญํ‚น(reranking)์„ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋ฉด ์ตœ๋Œ€ 67%๊นŒ์ง€ ๊ฐ์†Œ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ตฌํ˜„ ๋ฐฉ๋ฒ•

  1. ํ”„๋กฌํ”„ํŠธ ๊ฐœ์„ : Claude์™€ ๊ฐ™์€ ์–ธ์–ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ ํ…์ŠคํŠธ ์กฐ๊ฐ์— ๋Œ€ํ•œ ๊ฐ„๊ฒฐํ•œ ๋ฌธ๋งฅ ์„ค๋ช…์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.
  2. ๋ฌธ๋งฅ ์ถ”๊ฐ€ ์ž„๋ฒ ๋”ฉ: ์ƒ์„ฑ๋œ ๋ฌธ๋งฅ์„ ๊ฐ ํ…์ŠคํŠธ ์กฐ๊ฐ ์•ž์— ์ถ”๊ฐ€ํ•œ ํ›„ ์ž„๋ฒ ๋”ฉํ•ฉ๋‹ˆ๋‹ค.
  3. Contextual BM25 ์ ์šฉ: ๋ฌธ๋งฅ์ด ์ถ”๊ฐ€๋œ ํ…์ŠคํŠธ๋กœ BM25 ์ธ๋ฑ์Šค๋ฅผ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค.
  4. ๋ฆฌ๋žญํ‚น ์‚ฌ์šฉ: ๊ฒ€์ƒ‰๋œ ์ƒ์œ„ ํ…์ŠคํŠธ ์กฐ๊ฐ๋“ค์„ ๋ฆฌ๋žญํ‚น ๋ชจ๋ธ๋กœ ํ‰๊ฐ€ํ•˜์—ฌ ๊ฐ€์žฅ ๊ด€๋ จ์„ฑ์ด ๋†’์€ ๊ฒƒ๋“ค์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.

์„ฑ๋Šฅ ํ–ฅ์ƒ ๊ฒฐ๊ณผ

๊ณ ๋ ค์‚ฌํ•ญ

๊ฒฐ๋ก 

Contextual Retrieval์€ ์ „ํ†ต์ ์ธ RAG์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜์—ฌ ๋Œ€๊ทœ๋ชจ ์ง€์‹ ๊ธฐ๋ฐ˜์—์„œ๋„ ๋†’์€ ์ •ํ™•๋„์˜ ์ •๋ณด๋ฅผ ํšจ์œจ์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค. ์ด๋Š” AI ๋ชจ๋ธ์˜ ์‘๋‹ต ์„ฑ๋Šฅ์„ ์ง์ ‘์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๊ธ€